Статья 1317

Название статьи

РАЗРАБОТКА АЛГОРИТМА ОБРАБОТКИ РЕЧЕВЫХ СИГНАЛОВ ДЛЯ ОПРЕДЕЛЕНИЯ
ИНФОРМАТИВНО ЗНАЧИМЫХ ПАРАМЕТРОВ ПОГРАНИЧНЫХ ПСИХИЧЕСКИХ РАССТРОЙСТВ 

Авторы

Алимурадов Алан Казанферович, кандидат технических наук, директор студенческого научно-производственного бизнес-инкубатора, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), alansapfir@yandex.ru
Тычков Александр Юрьевич, кандидат технических наук, заместитель директора, Научно-исследовательский институт фундаментальных и прикладных исследований, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), tychkov-a@mail.ru
Чураков Петр Павлович, доктор технических наук, профессор, кафедра информационно-измерительной техники и метрологии, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40), ivan@pniei.penza.ru
Агейкин Алексей Викторович, младший научный сотрудник, Научно-исследовательский институт фундаментальных и прикладных исследований, Пензенский государственный университет (Россия, г.Пенза, ул. Красная, 40), keokushinka@yandex.ru

Индекс УДК

616.89

DOI

10.21685/2072-3059-2017-3-1

Аннотация

Актуальность и цели. Объектом исследования явились больные с пограничными психическими расстройствами Областной психиатрической больницы им. К. Р. Евграфова, у которых имеется высокий процент ложноотрицательных результатов диагностики заболеваний. Предметом исследования являются алгоритмы обработки речевых сигналов для диагностики пограничных психических расстройств. Цель – разработка алгоритма измерения частоты основного тона для систем обнаружения паттернов пограничных психических расстройств.
Материалы и методы. В качестве материалов использовались информативные параметры речевых сигналов – паттерны. Для эффективной обработки речевых сигналов использовался метод декомпозиции на эмпирические моды и его модификация – полная множественная декомпозиция на эмпирические моды с адаптивным шумом. Результаты исследований оценивались в сравнении с известными алгоритмами измерения частоты основного тона, реализованными на основе: автокорреляционной функции и ее модификаций («YIN»), устойчивого метода отслеживания основного тона (Robust Algorithm for Pitch Tracking, RAPT) и оценки основного тона пилообразной формы (Sawtooth Waveform Inspired Pitch Estimation, SWIPE).
Результаты. Разработан алгоритм измерения частоты основного тона для систем обнаружения паттернов пограничных психических расстройств. Суть алгоритма заключается в разложении речевого сигнала на частотные составляющие с помощью адаптивного метода анализа нестационарных сигналов – улучшенной полной множественной декомпозиции на эмпирические моды с адаптивным шумом и выделении составляющей, содержащей основной тон. Представлена блок-схема разработанного алгоритма и подробное математическое описание. Проведено исследование алгоритма с использованием сформированной верифицированной базы сигналов здоровых пациентов и пациентов с психогенными расстройствами мужского и женского пола в возрасте от 18 до 60 лет.
Выводы. В соответствии с результатами исследования разработанный алго-ритм измерения частоты основного тона обеспечивает повышение точности определения пограничных психических расстройств: для ошибки первого рода в среднем точнее на 10,7 % и для ошибки второго рода – на 4,7 %.

Ключевые слова

речевой сигнал, паттерн, частота основного тона, улучшенная полная множественная декомпозиция на эмпирические моды с адаптивным шумом, психогенные расстройства

 

 Скачать статью в формате PDF

Список литературы

1. Современные представления о специфике и проблемах диагностики пограничных психических расстройств / А. Ю. Тычков, А. В. Агейкин, А. К. Алимурадов, В. Б. Калистратов, С. Ю. Митрошина // Психическое здоровье. – 2017. – № 5. – С. 69–75.
2. Pantic, K. M. A dynamic texture-based approach to recognition of facial actions and their temporal models / Koelstra M. Pantic, Ioannis Patras // IEEE transactions on pattern analysis and machine intelligence. – 2010. – Vol. 32. – P. 1940–1954.
3. Бобков, А. С. Модели и методы определения эмоционального состояния человека на основе автоматизированной обработки и анализа видеоинформации : дис. …канд. техн. наук : 05.13.01 / Бобков Артем Сергеевич. – Москва, 2013. – 170 с.
4. Кислова, О. О. Психофизиологические предпосылки успешности распознавания эмоциональной речевой экспрессии : дис. ... канд. биол. наук : 03.00.13 / Кислова Ольга Олеговна. – Москва, 2009. – 151 с.
5. Agrafioti, F. ECG in Biometric Recognition: Time Dependency and Application Challenges / Foteini Agrafioti, Doctor of Philosophy Graduate Department of Electrical and Computer Engineering University of Toronto. – Toronto, 2011.
6. Kappeler-Setz, C. Towards long term monitoring of electrodermal activity in daily life / Cornelia Kappeler-Setz, Franz Gravenhorst, Johannes Schumm, Bert Arnrich, Gerhard Tröster // Journal Personal and Ubiquitous Computing. – 2013. – Vol. 17, iss. 2. – P. 261–271.
7. Farwell, L. A. Brain fingerprinting: a comprehensive tutorial review of detection of concealed information with event-related brain potentials / Lawrence A. Farwell // Cogn Neurodyn. – 2012. – Vol. 6. – Р. 115–154. DOI 10.1007/s11571-012-9192-2.
8. Quan, C. Sentence Emotion Analysis and Recognition Based on Emotion Words Using Ren-CECps / Changqin Quan, Fuji Ren // International Journal of Advanced Intelligence. – 2010. – Vol. 2, № 1. – P.105–117.
9. Заболеева-Зотова, А. В. Задача создания системы автоматизированного распознавания эмоций / А. В. Заболеева-Зотова, Ю. А. Орлова, В. Л. Розалиев, А. С. Бобков // Материалы международной научно-технической конференции OSTIS. – Минск : БГУИР, 2012. – С. 347–350.
10. Likforman-Sulem, L. EMOTHAW: A Novel Database for Emotional State Recognition From Handwriting and Drawing / Laurence Likforman-Sulem, Anna Esposito, Marcos Faundez-Zanuy, Stéphan Clémençon, Gennaro Cordasco // IEEE Transactions on Human-Machine Systems. – 2017. – Vol. 47, iss. 2. – Р. 273–284. DOI: 10.1109/THMS.2016.2635441.
11. Барабанщиков, В. А. Методы регистрации движений глаз в психологии: основы учебно-методического комплекса / В. А. Барабанщиков, А. В. Жегалло // Экспериментальная психология. – 2014. – Т. 7, № 1. – С. 132–137.
12. Loughland, C. M. Visual scanpaths to positive and negative facial emotions in an outpatient schizophrenia sample / С. М. Loughland, L. M. Williams, E. Gordon // Schizophrenia Research. – 2002. – Vol. 55, iss. 1-2. – P. 159–170.
13. Филатова, Н. Н. Модель интерпретации знака эмоций по естественной речи / Н. Н. Филатова, К. В. Сидоров // Известия Южного федерального университета. Технические науки. – 2012. – № 9 (134). – С. 39–45.
14. Давыдов, А. Г. Выбор оптимального набора информативных признаков для классификации эмоционального состояния диктора по голосу / А. Г. Давыдов, В. В. Киселев, Д. С. Кочетков, А. В. Ткаченя // Компьютерная лингвистика и интеллектуальные технологии : по материалам ежегод. Междунар. конф. «Диалог». – Вып. 11 : в 2 т. Т. 1 : Основная программа конференции. – М. : Изд-во РГГУ, 2012. –С. 122–128.
15. Williamson, J. R. Vocal and facial biomarkers of depression based on motor incoordination and timing / James R Williamson, Thomas F. Quatieri, Brian S. Helfer, Gregory Ciccarelli, Daryush D. Mehta // Proceedings of the 4th International Workshop on Audio-Visual Emotion. – Challenge, 2014. – С. 65–72.
16. Darley, F. L. Differential diagnostic patterns of dysarthria / F. L. Darley, A. E. Aronso, J. R. Brown // J. Speech Lang. Hear. Res. – 1969. – Vol. 12. – Р. 47–57.17. Dorry, M. K. Emotion Identification from Spontaneous Communication: A Thesis Submitted to the Department of Computer Science in Partial Fulfilment for the Degree of Master of Science in Computer Science / Mikiyas Kebede Dorry ; Addis Ababa University College of Natural Sciences. – Addis Ababa, Ethiopia, 2016. – P. 93.
18. Schwenzer, M. Impaired pitch identification as a potential marker for depression / Michael Schwenzer, Eva Zattarin, Michael Grozinger and Klaus Mathiak // BMC Psychiatry. – 2012. – Vol. 12, iss. 1. – P. 32–37.
19. Morist, M. U. Emotional speech synthesis for a radio dj: corpus design and expression modeling: master thesis MTG-UPF dissertation / M. U. Morist. – Barcelona, 2010.
20. Yingthawornsuk, T. Analysis of Speech Based on Spectral Entropy in Detecting Depressed among Control Subjects / Thaweesak Yingthawornsuk // International Conference on Computer and Communication Technologies (ICCCT'2012), May 26–27, 2012. – Phuket, 2012.
21. Yu, B. Cognitive impaiment prediction in the elderly based on vocal biomarkers / Bea Yu, Thomas F. Quatieri, James R. Williamson, James C. Mundt // Sixteenth Annual Conference of the International Speech Communication Association. – Dresden Germany, 2015. – Р. 3734–3738.
22. Grossberg, S. The Adaptive Self-organization of Serial Order in Behavior: Speech, Language / Stephen Grossberg // Pattern recognition by humans and machines: Speech perception. – 2013. – P. 187.
23. Staudacher, M. Fast fundamental frequency determination via adaptive autocorrelation / Michael Staudacher, Viktor Steixner, Andreas Griessner and Clemens Zierhofer // EURASIP Journal on Audio, Speech, and Music Processing. – 2016. – Issue 1. Dec. – P. 8.
24. Kumar, S. Efficient Time Domain Fundamental Frequency Estimation (Pitch Estimation) / Sunil Kumar, Manisha Jangra, // International Journal of Electronics & Communication Technology (IJECT). – 2015. – Vol. 6, iss. 3.
25. Eun-Joo, S. Feature Extraction Method for Predicting Depression by Frequency Domain Analysis / Eun-Joo Seo, Kwang-Seok Hong // International Conference on Civil, Materials and Environmental Sciences (CMES 2015). – London, UK, 2015. – P. 600–603.
26. Haraa, Y. Method for estimating pitch independently from power spectrum envelope for speech and musical signal / Yoshifumi Haraa, Mitsuo Matsumotob, Kazunori Miyoshi // Journal of Temporal Design in Architecture and the Environment, 2009. – Vol. 9, iss. 9. – Р. 121–124.
27. Shahnaz, C. A Spectro-Temporal algorithm for pitch frequency estimation from noisy observations / C. Shahnaz, W.-P. Zhu, and M. O. Ahmad // IEEE International Symposium on Circuits and Systems (ISCAS2008), May 18–21, 2008. – Seattle USA, 2008. – P. 1704–1707.
28. Klapuri, A. P. Multiple Fundamental Frequency Estimation Based on Harmonicity and Spectral Smoothness / Anssi P. Klapuri // IEEE Transactions on speech and audio processing. – 2003. – Vol. 11, № 6. – P. 804–816.
29. Cheveigne, A. «YIN» a fundamental frequency estimator for speech and music / A. Cheveigne, H. Kawahara // The Journal of the Acoustical Society of America. –2002. – Vol. 111, № 4. – P. 1917–1930.
30. Talkin, D. A Robust Algorithm for Pitch Tracking (RAPT) // Chapter 14 in Speech Coding & Synthesis / D. Talkin ; ed. by W. B. Kleijn and K. K. Paliwan. – New York, USA, Elsevier Science, 1995. – P. 495–518.
31. Camacho, A. А sawtooth waveform inspired pitch estimator for speech and music / A. Camacho, J. G. Harris // The Journal of the Acoustical Society of America. – 2008. – Vol. 123, № 4. – P. 1638–1652.
32. Alimuradov, A. K. Research of Frequency-Selective Properties of Empirical Mode  A. K. Alimuradov // International Conference on Engineering and Telecommunication (EnT), Nov. 18–19, 2015, Russia, Moscow, – Moscow, 2015. – P. 77–79. DOI: 10.1109/EnT.2015.9.
33. Speech/pause detection algorithm based on the adaptive method of complementary decomposition and energy assessment of intrinsic mode functions / A. K. Alimuradov, A. Yu. Tychkov, A. V. Ageykin, P. P. Churakov, Y. S. Kvitka and A. P. Zaretskiy // XX IEEE International Conference on Soft Computing and Measurements (SCM), May 24–26, 2017, Russia, St. Petersburg. – St. Petersburg, 2017. – P. 610–613. DOI: 10.1109/SCM.2017.7970665.
34. Huang, N. E. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis / N. E. Huang, Sh. Zheng, and R. L. Steven // Proc. R. Soc. Lond. – 1998. – Vol. A454. – P. 903–995.
35. Zhaohua, Wu. Ensemble empirical mode decomposition: A noise - assisted data analysis method / Wu Zhaohua, N. E. Huang // Advances in Adaptive Data Analysis. – 2009. – Vol. 1, № 1. – P. 1–41.
36. Yeh, J.-R. Complementary ensemble empirical mode decomposition: A novel noise enhanced data analysis method / J.-R. Yeh, J.-S. Shieh, and N. E. Huang // Adv. Adapt. Data Anal. – 2010. – Vol. 2, № 2. – P. 135–156.
37. Torres, M. E. A complete Ensemble Empirical Mode decomposition with adaptive noise / M. E. Torres, M. A. Colominas, G. Schlotthauer, P. Flandrin // International Conference on Acoustics, Speech and Signal Processing (ICASSP-11). – Prague (CZ), 2011. – P. 4144–4147.
38. Colominasa, M. A. Improved complete ensemble EMD: A suitable tool for biomedicalsignal processing / Marcelo A. Colominasa, Gaston Schlotthauera, Maria E. Torres // Biomedical Signal Processing and Control. – 2014. – Vol. 14. – P. 19–29.
39. Huang, X. Spoken Language Processing. Guide to Algorithms and System Developmen / X. Huang, A. Acero, H.-W. Hon // Prentice Hall. – New Jersey, 2001. – 980 p.
40. Фант, Г. К. Акустическая теория речеобразования / Г. К. Фант ; пер. с англ. Л. А. Варшавского и В. И. Медведева ; науч. ред. В. С. Григорьева. – М. : Наука, 1964. – 284 с.
41. Попов, Д. И. Оптимизация цифровых систем обработки сигналов / Д. И. Попов // Известия высших учебных заведений. Поволжский регион. Технические науки. – 2017. – № 1 (41). – C. 96–105.
42. Alimuradov, A. K. An Algorithm for Measurement of the Pitch Frequency of Speech Signals Based on Complementary Ensemble Decomposition Into Empirical Modes / A. K. Alimuradov // Measurement techniques. – 2017. – Vol. 59, № 12. – P. 1316–1323. DOI 10.1007/s11018-016-0994-1.
43. Alimuradov, A. K. Program Implementation of an Algorithm for Recognition of Speech Signals in the Labview Graphics Programming Environment / A. K. Alimuradov, A. Yu. Tychkov, M. V. Frantsuzov, P. P. Churakov // Measurement techniques. – 2015. – Vol. 58, iss. 9. – P. 965–969.

 

Дата создания: 06.02.2018 09:42
Дата обновления: 22.02.2018 10:06